메뉴

#오류 수정

SG
r/singularity 19일 전
IMP 8

GPT-5.5, 수학 벤치마크 오류 적발

최신 AI 모델 GPT-5.5가 최첨단 모델들의 수학 능력을 평가하는 까다로운 벤치마크인 FrontierMath의 치명적인 오류를 찾아냈습니다. 전체 문제의 약 1/3가량에서 오류가 발견되었으며, 이는 평가 지표를 검수할 정도로 AI 모델이 고도로 발전했음을 보여주는 의미 있는 사건입니다.

GPT-5.5 벤치마크 FrontierMath